Una visión geométrica para comprender conceptos en autoencoders dispersos
Explora cómo la geometría revela el aprendizaje de conceptos en autoencoders dispersos y permite interpretar neuronas de forma clara.
Explora cómo la geometría revela el aprendizaje de conceptos en autoencoders dispersos y permite interpretar neuronas de forma clara.
Descubre TEVI, un método que usa autoencoders dispersos para editar embeddings visuales y mejorar la alineación entre imágenes y texto en modelos como CLIP. Mejora la recuperación y robustez.
Reduce alucinaciones de Whisper hasta un 86% usando autoencoders dispersos. Aprende la técnica de steering en representaciones ocultas.
Concept-SAE: controla y edita conceptos en redes neuronales, mejorando interpretabilidad y detectando ataques adversariales. ¡Descúbrelo!
Descubre cómo Concept-SAE controla conceptos específicos en modelos de IA, mejorando interpretabilidad y detección adversarial.
Descubre cómo SASA mejora la interpretabilidad de LLMs reduciendo la fragmentación de características y usando la mitad de los tokens de entrenamiento.
¿Las activaciones de MLP mejoran el aprendizaje en contexto? Un estudio revela que no. Conoce los hallazgos y el futuro con autoencoders dispersos.
La cuantización no destruye todas las características interpretables: un análisis revela que el 62% persiste en INT6, pero las métricas engañan.
Descubre cómo la teoría de optimalidad explica el comportamiento de los Autoencoders Dispersos (SAE) y sus diccionarios dispersos. Mejora la interpretabilidad de las representaciones neuronales.
RAIGen descubre atributos raros y subrepresentados en modelos de imagen como Stable Diffusion, sin categorías predefinidas. Mitiga sesgos y amplifica características minoritarias.
AdaptiveK ajusta dinámicamente la esparcidad según la complejidad semántica, mejorando interpretabilidad y reconstrucción de modelos de lenguaje.